package ec.edu.ups.cidi.siia.plamdep.comunicacionweb.extractorlinks;
import java.util.ArrayList;

import ec.edu.ups.cidi.siia.plamdep.comunicacionweb.Utils.HtmlUtils;
public class LinksGoogle implements IExtractorLinks
{
   private ArrayList<String> resultados=new ArrayList<String>(); //el listado de links encontrados
   private HtmlUtils utils=new HtmlUtils();
   public void extraerLinks(String html)
    {
        System.out.println(html);
        html=html.replaceAll("\n"," ");
        ArrayList<String> lis=(ArrayList<String>)this.utils.obtenerEtiqueta2(html, "<li", "/li>", true,0).clone();
        for(String li:lis)
        { 
            ArrayList<String>href=(ArrayList<String>)this.utils.obtenerEtiqueta2(li, "href=", ">", false,0).clone();
            if(href.size()>0)
            {       ArrayList<String>links=(ArrayList<String>)this.utils.obtenerEtiqueta2(href.get(0), "/url\\?q=", "&amp", false,0).clone();
                    if(links.size()>0)
                         this.resultados.add(links.get(0).replace("/url?q=", "").replace("&amp",""));
            }
        }
    }
    
    public ArrayList<String> getLinks() 
    {
        return this.resultados;
    }
    
    public void setContenidoHTML(String contenidoHTML) {
        this.extraerLinks(contenidoHTML);
    }
}